묻고 답해요
129만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
model.predict 의 결과 값 index가 왜 movie id ?
predictions = model.predict([tmp_user, tmp_movie_data])아래와 같이 결과 값이 나오잖아요. 그런데, 저 결과의 index가 왜 movie id 인가요? [[3.9839544] [3.178115 ] [2.9170113] ... [2.1295495] [3.9083176] [3.711278 ]]
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
model.predict에 특정 user id로 상위 movie 5개 출력?
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요. 추천시스템을 다양한 방법을 통하여 쉽게 설명해 주셔서 감사합니다.질문과 같이, compile -> fit 해서 생성된 model에특정 user id 를 입력하여 추천된 상위 movie 5개를 출력해보려고 합니다. 강의 예제의 아래 부분의 user_id와 movie_id 그리고 직업을 입력해서해당 predictions 값에서 상위 movie를 가져올 수 있지 않을까 생각중 입니다. predictions = model.predict([user_ids, movie_ids, user_occ]) + mu 문제는, 딱 여기서 막혔습니다. 예제에는 6개의 사용자, 영화, 직업 받아서Predictions: [[4.0556927] [3.5347672] [2.4461157] [4.1715736] [3.9802952] [3.9247046]] 이렇게 보여지는 것같아서, 저것을 어떻게 사용해서, 영화 목록 5개면 5개 ,10개면 10개를 가져올 수 있을까요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
새로운 회원이 선택한 영화를 모델로 넘기는 방법 질문
안녕하세요 거친코딩님 현재 프로젝트 기획 구상 단계 인데요~현재까지 구상한 것은 거친코딩님이 올려주신 데이터를 구현한 모델(최신 데이터가 된다면 Sparse Matrix를 쓰고, 기존 올려주신 데이터를 활용하게 된다면, 협업필터링으로 모델을 구현하고자 합니다.)을 훈련시킨 다음, 이제 새 회원이 평점을 매긴 영화를 입력값으로 받아 영화를 추천해주는 웹 프로젝트를 하려고 합니다.현재 팀원은 3명이고, 각 각프론트엔드, 백엔드(스프링, DB-MySQL), 추천알고리즘 입니다.근데 지금 막히는 것이 기존데이터가 아닌 클라이언트에서 새로운 회원이 선택한 영화를 추천알고리즘으로 넘기는 것을 어떻게 해야할지 모르겠습니다.이 부분을 새로운 함수로 구현을 해야하는 것인지, 아니면 알려주신 알고리즘을 기반으로 수정으로도 구현이되는 것이 궁금합니다.
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
올려주신 파일과 sparse matrix
안녕하세요, 거친코딩님!올려주신 강의와 파일들을 보면서, 프로젝트를 하다가 궁금한게 있어서 질문드립니다. 강의에서 올려준 파일 u.user, u.item, u.data와 rating-20m.csv가 별개의 영화 평가 데이터 파일들 인가요? Sparse Matrix 알고리즘에서 rating-20m.csv 파일만 쓰여서 궁금해서 여쭤봅니다. 1)에서 질문한것이 맞다면 최신 무비렌즈 영화평가 데이터를 Sparse Matrix 에서 돌려도 될까요? (올려주신 rating-20m.csv파일과 최신 무비렌즈 영화 평가 데이터 내용이 똑같더라구요.) 강의에선 Sparse Matrix의 출력이 오차율이 나와서 그러는데, 최종적으로 추천 영화를 출력하려면 어떻게 구현하면 될까요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
Unable to allocate 55.9 GiB for an array with shape (25000, 100000, 3) and data type int64
안녕하세요.사용자 집단별 추천에서 모델별 RMSE를 계산하는 함수를 돌리면 램이 부족하다며 코랩이 중지됩니다.주피터를 이용해 다시 돌려보니y_pred = np.array([model(user, movie) for (user, movie) in id_pairs])에서Unable to allocate 55.9 GiB for an array with shape (25000, 100000, 3) and data type int64라는 오류가 떴습니다.데이터 사이즈가 이렇게 크지 않을 것 같은데 어떤 부분을 잘못한걸까요?아래는 제가 작성한 score 함수입니다.def score(model): # test 데이터의 user_id와 movie_id의 페어를 맞춰서 튜플로 반환 id_pairs = zip(x_test['user_id'], x_test['movie_id']) # 모든 user, movie 페어쌍에 대해서 주어진 model의 예측값을 계산하여 array 형태로 반환 y_pred = np.array([model(user, movie) for (user, movie) in id_pairs]) y_true = np.array(x_test['rating']) return RMSE(y_true, y_pred)
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
사용자 집단별 추천 코드
코드 내에서 score(model)안에 model로 best_seller, cf_gender등을 사용하셨는데, best_seller와 cf_gender함수는 user_id와 movie_id를 변수로 가지는데, score함수 안에 사용할 때는 score(best_seller)로 써도 작동되는 이유가 무엇인가요? score(best_seller(user_id, movie_id))와 같이 써야 작동되는것 아닌가요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
무비렌즈 최신 데이터를 이용하고싶은데요~
안녕하세요 거친코딩님!해당 알고리즘을 최신 무비렌즈 데이터를 이용해서 구현하려하는데요.해당 압축파일에 있는 파일과 강사님이 올려주신 파일이 확장자명이 다른데,최신파일로 구현하고자하면 밑에 파일에서 어떤걸 건들어야할까요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
추천시스템의 이진데이터 적용
안녕하세요. 데이터분석 공부하는 학생입니다.올려주신 강의 모두 잘 들었습니다.다만 제가 지금 적용하고자 하는 데이터가 이진데이터인데요.강의의 코드가 이진데이터에는 맞지 않아 문의드립니다.이진데이터를 추천시스템에 활용하는 다른 예도 찾아 보았는데요: https://towardsdatascience.com/recommender-systems-item-customer-collaborative-filtering-ff0c8f41ae8a어차피 여기서도 코사인유사도를 활용하고 있어거친코딩님의 강의의 예를 활용하고 싶은데 잘 안되네요.혹시 한 번 봐주실 수 있을까요?적용 코드: https://drive.google.com/file/d/11qlP4zOAFewSiHxo_T7fp_Ql-WgSpHS3/view?usp=sharing
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
평가 관련
안녕하세요 강사님. 평가 지표에 관련된 내용을 여쭤보려고 합니다. mAP, nDCG 같은 성능을 측정하려면 어떻게 해야 하나요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
딥러닝 추천시스템 변수추가 부분 코드 관련 질문입니다.
기존에 코드에 나와있는 occupation에 더해 age 변수를 추가하고 싶습니다. 하지만 age embedding layer에 들어갈 input dimension을 len(users['age'].unique()) 라 설정하고 모델을 fit 시키면 InvalidArgumentError: Graph execution error: 라는 에러가 뜹니다. 이때, age embedding layer의 input dimension을 len(users)라고 설정하면 fit 코드가 정상적으로 진행됩니다. 그 이유와 변수 embedding layer의 input dimesion을 설정할 때 꼭 unique 값의 개수를 넣어야 하는건지, 그리고 그 이유 도 알고 싶습니다.
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
딥러닝을 위한 추천시스템 원핫 인코딩 질문
148페이지 그림을 보면 유저아이디와 아이템 아이디를 원핫벡터 인코딩 한후에 임베딩 레이어에 들어가는데 왜 책에 있는 코드는 원한 인코딩을 적용 하지 않는지 궁금합니다. 원핫 인코딩을 적용하지 않은 이유를 알려주셨으면 합니다.
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
MergeError가 납니다
강의 12분 26초에 성별에 따른 예측값 계산할 때, pd.merge(x_train, users) 부분에서 MergeError: No common columns to perform merge on. Merge options: left_on=None, right_on=None, left_index=False, right_index=False와 같은 에러메시지가 뜹니다. 어떻게 해결하면 될까요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
코드 오류 질문입니다!
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해 계속 저런 오류가 뜨는데 어떻게 해결할 수 있을까요?? 그리고 데이터 파일은 어디서 받아볼 수 있을까요??
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
코드를 똑같이 따라햇을때
데이터프레임에서 강의에 나오는거랑 같지 않은 값들이 나온다면 사이에 먼가 코드를 잘못 짰다고 봐도 될까요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
강의자료는 어디서 다운로드 받을 수 있나요?
강의자료는 어디서 다운받을 수 있나요? OT의 PDF 말고 수업이 진행되는 ppt또는 pdf 자료를 어디서 받나요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
ML 방식 모델 활용방안에 대해서
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요 강의 수강을 통해 추천시스템에 대해 이해에 많은 도움이 되었습니다 현업에 적용하기위해 강의를 시청하여, 추천시스템을 만들고자하는데 파이썬 및 인공지능 기초적인 지식이 부족하여 문의드립니다 인공지능을 활용한 학습모델생성 강의를 수강 후, 학습시킨 모델을 직접 활용해서 추천결과를 얻고싶은데 코드를 어떻게 구현하면 추천결과를 얻을 수 있을까요?
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
화면이 안나오는데 정상인가요?
안녕하세요 아래 캡처처럼 화면이 안나오는데 제가 원래 이런건지 궁금합니다.
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
아이템 기반 CF 코드 질문
안녕하세요. 강의 7분 43초에 나오는 부분이 이해가 안갑니다.. rating_matrix_t[user_id] -> 이 부분은 기존 rating_matrix에서 transpose된 matrix니까 movie_id가 들어가야 하는게 아닌가요? 제가 이해를 잘 못하겠어서 조금만 더 설명해주시면 감사하겠습니다! 좋은 강의 감사합니다!
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
실시간 처리 질문
안녕하세요. 먼저 강의 잘 보고 있습니다! 강의를 보면서 의문이 드는게 있습니다. 현업에서는 데이터들이 많고 반응 속도가 중요할 것이라고 생각됩니다! 1. 많은 데이터들을 모두 메모리에 올리고 하나요? 아니면 db에 어떤 형식으로 저장을 하나요?? db에 저장한다해도 결국 cosine_similarity를 하려면 모든 정보를 다 메모리로 불러와야 되는건가요...? 이러면 다시 처음 질문으로 돌아가서 너무 궁금합니다ㅠㅠ 2. 지금 알려주시는 방법들이 실무에서 사용이 되나요? 예를 들어 쇼핑몰 제일 처음 들어갔을 때 맞춤 상품들을 보여준다고 하면, 사용자들이 로딩을 보는 시간이 몇초 될 것 같은데 제 예상과는 달리 지금 알려주시는 방법들이 빠른가요?? 아니면 다른 방법들을 사용하시는 걸까요?? 3. 지금 설명해주시는 방법들이 다 시간과는 연관이 없어보입니다! (강의 소개에서 연속값을 사용하는 개인화 추천 기술을 다룬다고 하셔서 제가 잘못 이해해서 시간도 고려한 데이터들을 사용하는 줄 알았습니다 ㅠㅠ) 제가 연속된 값들 즉 영화 A -> B -> C -> D를 본사람이 존재(p사람) 영화 A -> C -> B -> E를 본사람이 존재(q사람) 일떄 어떤 사람이 A -> B - > G 를 봤다면 다음에 볼 영화를 추천해준다 할 떄 p랑 시간 순으로 비슷하니 p가 본 C 또는 D를 추천해준다와 같이 시간도 예측 범위 안에 포함하고 싶다면 어떻게 해야하나요?? 지금 보여주시는 데이터들은 column들이 영화 이름으로 되어있어서 시간 정보가 삭제되는 것 같은데 해당 내용도 궁금합니다!! 좋은 강의 감사합니다!
-
해결됨Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능
CF 관련 질문
안녕하세요. 제가 보다가 궁금증이 생겼습니다! sim_scores를 할 때 자기 자신에 대한 값은 제외하지 않고 하나요?? 좋은 강의 감사합니다!